手把手教你用云E(二):VINA分子对接
1.前言
抗白血病药物格列卫是ABL激酶抑制剂,1IEP晶体结构为格列卫(STI, GLEEVEC)与ABL激酶的复合物结构。在本练习中,我们在云E算力平台上已经预装好的OpenBael与分子对接软件完成:1)蛋白结构准备;2)配体结构准备;3)分子对接参数设置;4)分子对接;5)结果文件的格式转化;6)可视化分析。
本教程需要了解的预备技能:
1) 对Linux的shell命令有初步了解;
2) 知道分子可视化软件Pymol有初步了解
本教程用到的软件:
1) PYMOL:在本地机器上使用
2) OpenBabel:用于格式转化
3) Vina:分子对接
2.操作步骤
2.1蛋白-配体复合物结构的准备
从PDB数据库上下载格列卫与ALB的复合物结构
在PYMOL的命令行键入:fetch 1iep
提取CHAIN A,并创建为一个对象1iepA
在PYMOL的命令行键入:create 1iepA, chain A
删除对象1iep,仅保留CHAIN A
在PYMOL的命令行键入:delete 1iep
删除水分子
在PYMOL的命令行键入:remove resn HOH
添加极性氢原子
在PYMOL的命令行键入:h_add elem O or elem N
2.2 保存复合物结构的配体结构
创建对象ligand,保存复合物结构的配体STI
在PYMOL的命令行键入:create ligand, resn STI
保存配体结构到本地文件
在PYMOL的命令行键入:save d:/work/docking/ligand.pdb, ligand
2.3保存复合结构中的蛋白结构
创建对象protein,保存复合物结构的蛋白部分
在PYMOL的命令行键入:create protein, 1iepA and not resn STI
保存蛋白结构到本地文件
在PYMOL的命令行键入:save d:/work/docking/protein.pdb, protein
2.4 输入文件的准备
在2.2与2.3小节,我们从复合物结构里提取出了配体与蛋白的PDB文件,分别为ligand.pdb与protein.pdb。现在假设我们已经将这两个文件上传到了云E算力平台的下的一个文件夹里,开始准备Vina计算用的文件。
加载openbabel
在云E算力平台,openbabel已经通过Anacona安装于rdkit虚拟环境下,因此需要加载Anaconda3,并激活rdkit环境,依次键入如下命令:
>module add Anaconda3/2020.02
>source activate
>conda activate rdkit
加载成功后,会出现类适于下面的shell界面:
准备蛋白的PDBQT文件
>obabel -ipdb protein.pdb -o pdbqt -xr -O protein.pdbqt
准备分子对接配置文件
配置文件需要设定结合位点的中心点以及box尺寸,其中从2.2提取配体的质心是可靠结合位点中心,用openbabel可以获得box文件:
obabel -ipdb ligand.pdb -obox
出现如下提示:
我们需要用到第二行的最后3列数,分别为中心点的X,Y,Z坐标。
现在,可以创建配置文件:
>touch config.txt
>vim config.txt
输入如下内容:
准备配体文件
在2.2获得ligand.pdb主要用来定义config.txt的中心坐标用,而不是做为本次计算的输入文件用。我们可以用Chem3D绘制imatinib的3D结构,优化(Optimization)之后保存为mol2文件备用。也可以从PubChem上下载一个3D结构保存为sdf文件备用。总的来说,无论是自己画的,还是下载的,保存为sdf或mol2都可以方便的用openbabel转化为vina可用的文件。在这个算例里,我们从ZINC下载ZINC19632618化合物,保存为mol2。现在用openbabel转化为pdbqt格式:
>obabel –imol2 ZINC000019632618.mol2 –opdbqt –o ZINC000019632618.pdbqt
2.5分子对接
现在我们准备好了三个关键文件:
蛋白结构:protein.pdbqt
待对接化合物:ZINC000019632618.pdbqt
VINA配置文件:config.txt
确保三个文件在同一目录里,键入如下命令开始对接计算:
>vina –config config.txt –ligand ZINC000019632618.pdbqt
计算完毕,获得vina.log与vina.pdbqt两个输出文件。其中vina.pdbqt为docking的pose,可以用来分析docking预测的相互作用模式。
2.6可视化分析
为了便于可视化分析,需要先将vina.pdbqt转化为sdf等更通用的文件格式:
>obabel -ipdbqt vina.pdbqt -osdf -O vina_out.sdf
现在,将vina_out.sdf文件下载;用PYMOL依次读入protein.pdb与vina_out.sdf可以分析结合模式,如下图2.1所示。
图2.1 VINA分子对接预测的结合模式 / 图片来源于网络
3.小结
在本教程中,我们用Pymol下载复合物结构,并进了蛋白结构准备,对A链加极性氢并保存为protein.pdb,并用openbabel转化为vina可用的受体结构文件。
还用PYMOL将复合物结构的配体提取出来,保存为ligand.pdb,并用openbabel计算其质心用来定义VINA对接配置文件的中心坐标。
还用openbabel将从ZINC上下载的Imatinib 3D结构转化为PDBQT格式。最后,进行了分子对接计算,并将结果转化为通用的sdf格式用PYMOL进行可视化分析。
相关
最新
技术
关于云端
深圳云端软件有限公司(Cloudam)是弹性算力与云成本优化的技术领导者,为企业打造一站式的算力云平台及自动化云成本优化服务。云端软件推出的云E算力平台整合了全球主流公有云近50个地域的高性能计算资源,能为人工智能、仿真模拟、生物科技、材料化学等行业提供弹性、高效、经济的算力支持。
Cloudam成立于瑞典斯德哥尔摩,在深圳及斯德哥尔摩两地运营,团队核心成员来自于Oracle、Ericsson、IBM、华为等知名企业,拥有15年以上的世界500强企业技术服务经验和研发背景,已成功为欧洲及中国多家企业提供产品和技术服务。
分享、在看与点赞
了解更多高性能计算与云的知识